李萌:三大效率革命将重置智能金融底层逻辑


李萌

全国政协委员

科学技术部原副部长


中国人工智能基础层正在进行效率革命,模型效率革命、算力效率革命如火如荼,数据效率革命初见端倪,三大效率革命由技术和工程突破与集成创新引发,形成飞轮效应,交替引领中国人工智能发展波浪式前进。

所谓“效率革命”指是性能大幅度提升,成本大幅度下降,带动应用大幅度拓广加深。标志是“能效比”大幅度提升。

一、模型效率革命正在引领全球AI发展趋势并已取得巨大成功

模型效率革命是混合架构创新、训练方法创新、注意力机制创新、极致的软硬件协同等系列技术与工程创新推动,推动模型训练和推理成本大幅度下降,用1/10的成本、1/20的算力训练出与世界顶级模型性能接近的模型,显著降低了经济门槛,实现技术民主。同时,坚持走开源路线,实现成果共享,显著降低了技术门槛,实现AI平权,目前中国最新的开源模型性能在全球排行榜上已经逼近甚至超过最好的闭源模型性能。中国的大模型技术延续着你追我赶的态势,“能效比”不断有新的提升,推动应用走向深入。

二、算力效率革命正在突出重围,是填补算力供给与需求巨大缺口的技术现实出路,也是包围与突围的一场狭路相逢

算力效率革命是中国人工智能眼下的破围之道、长期的立身基础。中国算力总量不小,仅次于美国居全球第二,但智算比例不高,根据中国信通院数据,2024年我国智算比例大体占32%(2025年目标是35%)。

目前全球算力端需求是强劲的,中国也是如此。在全球智能化的大背景下,算力短板就是中国AI的短板,也是中国现代化强国建设的短板。

从供给侧看,全球算力产量接近极限,模型企业与算力企业深度绑定,构建超大规模算力设施,供应链正处于满负荷状态。总的态势是供需两旺,美国算力需求基本盘目前依然稳固,中国一些算力消耗大厂也处于需求强劲状态。在技术封锁的形势下,如何提高计算性能以满足AI加速发展的需要,算力效率革命已经登场。

目前算力效率革命主要是通过新结构来驱动,是一系列的技术组合和工程创新。比较突出的是虚拟化软硬件协同的“池化”技术、“切片”技术,加上堆叠与集成技术,如华为超节点384、中科曙光640,还有光通信和算力传输技术、热管理新技术等系列技术与工程创新为主,也包括存算一体、XPU多处理器。

这中间有两个非常重要的技术“池化”和“切片”。“池化”技术是将物理上分散的、异构的计算资源,包括CPU、GPU以及不同服务器算力资源,用软件定义的方式整合成一个统一的、可灵活调度的“资源池”,通过动态调度、弹性复用、细粒度管理等方式,实现集约高效利用。通过“池化”打通了不同服务器、不同地理位置,甚至不同架构(X86和ARM),连接了所有的资源孤岛,用户无需关心算力从哪里来,只需从池中按需调用。从一些公司的实践看,采用池化技术可将算力资源利用率和整体效率从10%—30%提升到60%—90%。“切片”技术与池化技术的思路正好相反,是将一个统一的物理资源通过隔离和定制化技术,分割成多个独立的、虚拟的、功能各异的逻辑单元,动态分配算力资源,进行定制化服务。简言之,是将一套共享的物理基础设施整体资源,划分成更小的单元,形成端到端“专属通道”或“专属服务”。

在“池化”与“切片”的思路中,这种“聚”与“分”是相通的。“池化”的特点是“资源物理分散、使用逻辑集中”;”切片”的特点是“资源物理集中(共享)、使用逻辑分立”。虽然他们采取了“分”与“聚”的不同思路,但共同的目标有三点:一是提高资源利用率,“池化”避免闲置,“切片”精准分配;二是算力资源按需分配和弹性伸缩,实现灵活性与敏捷性调度;三是支持多样化服务,在一个统一的基础算力平台上能够同时支持各种不同的业务需求,从而实现性能大幅度提升,消耗大幅度下降。这两项技术一“聚”一“分”,为构建灵活、高效、智能的基础设施探索了新的方法。

目前人们寄予更大希望的计算新范式,比如光计算、类脑计算、量子计算等还没有进入到算力提升的主渠道,未来计算范式的转换与新结构相比将带来更彻底的算力飞跃。

三、数据效率革命拉开序幕,将进一步夯实中国优势的基础

我们常讲中国有丰富的场景、数据多,但数据多能否成为数据优势并转化为智能优势,还有很多工作要做。从贯通模型、算力、数据产业链的思路出发,不管是推进数字化、智能化进程的急需,还是数据技术自身进步的必然,抑或三者协同进步、协调发展,都要求数据领域有一场效率革命来重塑中国的优势。

数据效率革命的主要目标是从被动存储数据转变为主动地、智能地利用数据,实现更好用更快用,把单纯的数据治理转变成为价值创造。

数据效率革命目前有三大关键技术支柱:“湖仓一体”(数据架构变革和数据查询技术突破)、“本体”(统一语义层)、“数据智能体”(数据治理本身的技术趋势是智能化,数据应用层与AI的结合需要数据智能体)等关键技术以及它们的融合。这三大支柱中,“湖仓一体”前几年已开始兴起,“本体”借鉴Palantir 正在走来的路上,而数据智能体正当其时,这三个方面正是数据驱动型企业进化的下一个里程碑。

“湖仓一体”架构即融合数据湖与数据仓库,形成数据的超级存储+高效计算底座,实现海量存储+高效计算,保障数据供给。这一架构正在重新定义数据管理方式,形象说法是把杂乱无章的储物间(湖)和井井有条的档案室(仓)合并成一个既能海量存又能快速提取的智能仓库,鱼和熊掌兼得。这一技术在有的企业使用,把自然语言处理效率提高了300%,一次性准确率达到了89%。

“本体”即数据的语义翻译官+规则制定者,将分散数据转化为可关联的语义网络,保障数据好理解。

“数据智能体”即业务场景的自主管家,推动数据与AI的深度融合,实现业务需求的自动理解与执行,保证用好数据。数据智能体核心价值是解决效率痛点,释放数据价值。这个痛点一是如何打通数据孤岛;二是如何将分散数据整合成系统感知和业务整体。数据智能体在数据生态系统中处于整合者地位,发挥承上启下连接作用。以数据智能体为中心形成AI数据技术群,可能成为数据效率革命重要的推动者和有效杠杆。

综合起来看,大模型效率革命和算力效率革命,大大节省算力开销、便捷算力调度,算力成本速降与模型能力速升形成了“剪刀差”;数据效率革命把数据工作从“专业工匠”转变为“智能工厂”,让数据从”资产”真正变成“生产力”。“效率”被数据智能体重新定义,衡量标准已经从“更快”转向“不用等”。这是数据效率革命的本质。

“三大效率革命”不是孤立的,而是环环相扣、层层递进的,形成智能飞轮效应。

效率革命将使人工智能技术迭代和产业应用呈现高价值场景创造和高能效比替代并行推动的局面,智能金融的底层逻辑将被重置。

一是金融业智能进化逻辑更加突出价值导向。金融企业智能化进程要围绕着一个清晰的价值锚点进行优先序安排,避免大量投入采用被时代过早超越的模型和技术。比如,现在的基模越来越强大,发展下去一些领域是否还需要花费巨量资金和人力微调训练垂直模型,有的数据企业反映已经选用好的基模直接在具体场景中应用了;当前金融业智能化的首要任务是打好数据基础,要围绕清晰的智能化目标把数据要素的治理、流通和价值释放工作安排好,在此基础上智能化进程才能收放自如、自主可控。

二是智能企业估值逻辑更加突出“能效比”要求。在智能化绿色化的大背景下,“能效比”将在很大程度上决定这个技术有没有应用前景,决定企业有多大的潜在价值,甚至决定智能经济、智能社会发展能走多远,而且“能效比”的倒逼还将不断催生新模型新技术新应用。要用真实“能效比”作为主要的估值基准,衡量所有智能企业潜在价值。围绕“能效比”调整人工智能企业估值逻辑将会成为风险投资的共识,比如DEEPSEEK刚出来时,英伟达当天市值减少6000亿,“千问恐慌”不仅是技术问题,也会衍生出金融问题。

三是资本市场识别逻辑更加突出当期盈利和未来梦想的相互成就。对未来保持信心和乐观的“市梦率”可以有,但与真实的“利润率”需要保持相对合理的差距,避免吹成大泡泡的极端“市幻率”。对“投硬科技”中的“硬”需要深化认识,算力属于硬资产硬科技是共识,模型和数据在智能化进程中也应视为硬科技,都可能成为硬资产,这些领域能形成护城河的更是硬资产,谁能否定英伟达CUDA生态的价值呢。随着数据从“资产”变成“生产力”的价值提升,数据能力本身已经成为判别硬科技的硬核标准。

粤海校区:深圳市南山区南海大道3688号 

丽湖校区:深圳市南山区学苑大道1066号电话:0755-26536114

版权所有©️深圳大学 粤ICP备11018045号

联系方式

电话:0755-23996606

邮箱:gifts@szu.edu.cn

官方微信公众号